AI资讯新闻榜单内容搜索-Lilian Wen

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Lilian Wen
刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿

刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿

刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿

就在刚刚,OpenAI前安全副总裁Lilian Weng,疑似爆出了90亿估值神秘新公司Thinking Machines的首个产品——一台专为AI训练打造的「手动调参仪表盘」?

来自主题: AI资讯
7790 点击    2025-05-26 21:05
离职OpenAI后Lilian Weng博客首发!深扒RL训练漏洞,业内狂赞

离职OpenAI后Lilian Weng博客首发!深扒RL训练漏洞,业内狂赞

离职OpenAI后Lilian Weng博客首发!深扒RL训练漏洞,业内狂赞

Lilian Weng离职OpenAI后首篇博客发布!文章深入讨论了大模型强化学习中的奖励欺骗问题。随着语言模型在许多任务上的泛化能力不断提升,以及RLHF逐渐成为对齐训练的默认方法,奖励欺骗在语言模型的RL训练中已经成为一个关键的实践性难题。

来自主题: AI资讯
7019 点击    2024-12-06 09:54